AI资讯新闻榜单内容搜索- LLM

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: LLM

LLM中最难搞的表格最新梳理，需要什么请自取

LLM中最难搞的表格最新梳理，需要什么请自取

LLM中最难搞的表格最新梳理，需要什么请自取

您可能已经在产品里放进了问答、总结、甚至自动报表模块，但表格一上来，体验就变味了，这不奇怪。表格是二维、带结构、还经常跨表跨文，和纯文本完全不一样；项目作者在《Tabular Data Understanding with LLMs》里把这件事掰开揉碎，从输入表示到任务版图，再到评测与未来方向都梳理清楚了。

来自主题: AI资讯

8930 点击 2025-08-21 11:12

GPT-5、Grok 4、o3 Pro都零分，史上最难AI评测基准换它了

GPT-5、Grok 4、o3 Pro都零分，史上最难AI评测基准换它了

GPT-5、Grok 4、o3 Pro都零分，史上最难AI评测基准换它了

前沿 AI 模型真的能做到博士级推理吗？前段时间，谷歌、OpenAI 的模型都在数学奥林匹克（IMO）水平测试中达到了金牌水准，这样的表现让人很容易联想到 LLM 是不是已经具备了解决博士级科研难题的推理能力？

来自主题: AI资讯

9820 点击 2025-08-15 20:41

Attention Sink产生的起点？清华&美团首次揭秘MoE LLM中的超级专家机制

Attention Sink产生的起点？清华&美团首次揭秘MoE LLM中的超级专家机制

Attention Sink产生的起点？清华&美团首次揭秘MoE LLM中的超级专家机制

稀疏激活的混合专家模型（MoE）通过动态路由和稀疏激活机制，极大提升了大语言模型（LLM）的学习能力，展现出显著的潜力。基于这一架构，涌现出了如 DeepSeek、Qwen 等先进的 MoE LLM。

来自主题: AI技术研报

7859 点击 2025-08-12 11:07

从 AI 创业角度看 GEO：如何引流、效果评估，以及创业机会在哪里？

从 AI 创业角度看 GEO：如何引流、效果评估，以及创业机会在哪里？

从 AI 创业角度看 GEO：如何引流、效果评估，以及创业机会在哪里？

GEO/AEO，并不是一个全新的概念。简单说来，就是 AI 搜索和 LLM 时代的 SEO。

来自主题: AI资讯

7298 点击 2025-08-11 11:07

硬核拆解大模型，从 DeepSeek-V3 到 Kimi K2 ，一文看懂 LLM 主流架构

硬核拆解大模型，从 DeepSeek-V3 到 Kimi K2 ，一文看懂 LLM 主流架构

硬核拆解大模型，从 DeepSeek-V3 到 Kimi K2 ，一文看懂 LLM 主流架构

自首次提出 GPT 架构以来，转眼已经过去了七年。如果从 2019 年的 GPT-2 出发，回顾至 2024–2025 年的 DeepSeek-V3 和 LLaMA 4，不难发现一个有趣的现象：尽管模型能力不断提升，但其整体架构在这七年中保持了高度一致。

来自主题: AI技术研报

9405 点击 2025-08-08 11:52

Discrete Tokenization：多模态大模型的关键基石，首个系统化综述发布

Discrete Tokenization：多模态大模型的关键基石，首个系统化综述发布

Discrete Tokenization：多模态大模型的关键基石，首个系统化综述发布

近年来，大语言模型（LLM）在语言理解、生成和泛化方面取得了突破性进展，并广泛应用于各种文本任务。随着研究的深入，人们开始关注将 LLM 的能力扩展至非文本模态，例如图像、音频、视频、图结构、推荐系统等。

来自主题: AI技术研报

7764 点击 2025-08-06 12:18

大模型无法真正理解视频，GPT-4o正确率仅36%，南洋理工大团队提出新基准

大模型无法真正理解视频，GPT-4o正确率仅36%，南洋理工大团队提出新基准

大模型无法真正理解视频，GPT-4o正确率仅36%，南洋理工大团队提出新基准

视频大型语言模型（Video LLMs）的发展日新月异，它们似乎能够精准描述视频内容、准确的回答相关问题，展现出足以乱真的人类级理解力。

来自主题: AI技术研报

7695 点击 2025-08-02 12:43

ACL 2025｜驱动LLM强大的过程级奖励模型（PRMs）正遭遇「信任危机」？

ACL 2025｜驱动LLM强大的过程级奖励模型（PRMs）正遭遇「信任危机」？

ACL 2025｜驱动LLM强大的过程级奖励模型（PRMs）正遭遇「信任危机」？

近年来，大型语言模型（LLMs）在复杂推理任务中展现出惊人的能力，这在很大程度上得益于过程级奖励模型（PRMs）的赋能。PRMs 作为 LLMs 进行多步推理和决策的关键「幕后功臣」，负责评估推理过程的每一步，以引导模型的学习方向。

来自主题: AI技术研报

8102 点击 2025-07-28 10:49

提速79%！上交大新方法优化企业级AI流程调度 | IEEE ICDCS’ 25

提速79%！上交大新方法优化企业级AI流程调度 | IEEE ICDCS’ 25

提速79%！上交大新方法优化企业级AI流程调度 | IEEE ICDCS’ 25

复合LLM应用 (compound LLM applications) 是一种结合大语言模型（LLM）与外部工具、API、或其他LLM的高效多阶段工作流应用。

来自主题: AI技术研报

9368 点击 2025-07-25 09:51

ICML 2025 | 大模型能在信息不完备的情况下问出正确的问题吗？

ICML 2025 | 大模型能在信息不完备的情况下问出正确的问题吗？

ICML 2025 | 大模型能在信息不完备的情况下问出正确的问题吗？

大语言模型（Large Language Model, LLM）在复杂推理任务中表现卓越。借助链式思维（Chain-of-Thought, CoT），LLM 能够将复杂问题分解为简单步骤，充分探索解题思路并得出正确答案。LLM 已在多个基准上展现出优异的推理能力，尤其是数学推理和代码生成。

来自主题: AI技术研报

6953 点击 2025-07-24 15:10

上一页当前第8页,共25页下一页